3  FAIR-Prinzipien berücksichtigen

Die FAIR-Prinzipien sind Richtlinien für die Speicherung und Veröffentlichung wissenschaftlicher Daten. Einen guten Einstieg bieten „Data models to GO-FAIR (2017) und Wilkinson u. a. (2016).

Daten sollen auffindbar, zugänglich, interoperabel und wiederverwertbar sein. Diese vier Eigenschaften werden häufig auf 15 FAIR-Prinzipien abgebildet. Auf der Ebene der vier grundlegenden Eigenschaften bietet Ihnen dieses Kapitel aber einen ersten Einstieg.

Hinweis

In Kapitel 6.3 finden Sie eine Checkliste der 15 FAIR-Prinzipien in einfachem Markdown-Textormat.

3.1 Findable: DOI, Metadaten und Suchmaschinenoptimierung

Unsere Forschungsdaten und Softwareprojekte erstellen und pflegen wir häufig mit speziellen Softwarewerkzeugen. Dabei generieren wir schon vor der Veröffentlichung fortwährend Metadaten. Diese sind üblicherweise eher technischer Natur und gern in werkzeugspezifischen Konfigurationsdateien verstreut.

  • Dann haben wir für jedes mit GitHub verwaltete Projekt eine README-Datei erstellt, die weitere Informationen über unser Projekt enthält (Kapitel 1).

  • Dann haben wir unsere Projekte in Zenodo integriert und müssen auch dort Informationen ergänzen (Kapitel 1).

Letztendlich wollen wir, dass unsere Forschungsdaten oder Softwareprojekte als Produkte eines Forschungsprozesses gefunden werden können. Dazu müssen wir sicher stellen, dass produktrelevante Metadaten in einem standardisierten Format vorliegen. Das ist mit Zenodo aber leichter, als es zunächst den Anschein hat, die Arbeit ist im Grunde schon erledigt.

3.1.1 DOI und Metadaten ergänzen

Prüfen Sie folgende Punkte, um die Auffindbarkeit der Daten zu verbessern:

  1. Stellen Sie sicher, dass Metadaten in einem standardisierten Format beschieben werden. Bekannte Formate sind z. B. DataCite oder Dublin Core.

  2. Machen Sie Angaben zu üblichen Schlagwörtern und standardisierten Vokabularen zu Ihrem Fachgebiet.

  3. Dokumentieren Sie im Datenmanagementplan die Art der Vergabe einer DOI. sowie das verwendete Format oder den Standard, nach dem Metadaten kodiert sind (@#sec-dmp).

Zenodo übernimmt für Sie neben der Vergabe eines digitalen Objektbezeichners (DOI, siehe auch DOI Handbook (2023)) auch die Generierung von standardisierten Metadaten. Data Cite und Dublin Core können dann direkt aus Zenodo abgefragt werden, beispielsweise über die Exportfunktion (unten rechts in Abbildung 3.1).

Abbildung 3.1: Export von Metadaten aus Zenodo.
Hinweis

In Kapitel 6.5 finden Sie die Metadaten zu diesem Dokument in den Formaten DataCite JSON und Dublin Core XML.

Ergänzen Sie bei Bedarf im DMP:

**Metadatenformat**:  
- [z. B. DataCite, Dublin Core]  

**Beschreibung der Daten**:  
- Jede Datei wird durch eine README-Datei dokumentiert, die Informationen über:  
   - Den Inhalt  
   - Die Erhebungsmethodik  
   - Verwendete Software oder Tools enthält.
- Schlagwörter: [Themenrelevante Begriffe, z. B. "Machine Learning", "Umweltdaten"]  

**DOI-Zuweisung**:  
- Die Veröffentlichung erfolgt mit einem DOI über Zenodo.

3.1.2 Suchmaschinen unterstützen

  • GitHub-Projekte werden in der Regel von GitHub automatisch indexiert, so dass sie besser gefunden werden können.

  • Zusätzlich sollten Sie keine unnötigen .gitignore-Einstellungen in GitHub verwenden.

3.2 Accessible: Langfristige Zugänglichkeit sicherstellen

  • Ergänzen Sie im Datenmanagementplan explizit Angaben zur langfristigen Speicherung über Zenodo und dass die Daten öffentlich zugänglich sind (Open Access).

  • Zeitliche Einschränkungen des Zugriffs können über die den so genannten Embargo-Status in Zenodo geregelt werden.

Ergänzen Sie bei Bedarf im DMP:

**Zugänglichkeit**:  
- Die Daten sind über Zenodo öffentlich zugänglich (Open Access).  
- Der DOI garantiert die dauerhafte Verfügbarkeit.  
- Einschränkungen: Einschränkungen des Zugriffs werden über Embargo-Status Optionen von Zenodo geregelt.

3.3 Interoperable: Datenformate und Standards beschreiben

  • Verwenden Sie für Ihre Daten Dateiformate, die eine möglichst einfache maschinelle Verarbeitung erlauben.

    • Es bieten sich offene Formate wie z. B. CSV gemäß Hausenblas u. a. (2014) und JSON gemäß Charollais an.

    • Verzichten Sie auf proprietäre Formate wie z. B. Microsoft Excel (.xlsx-Dateien).

  • Nennen Sie die verwendeten Standards für Daten und Metadaten wie z. B. DataCite, Dublin Core oder JSON-Schema.

  • Nennen Sie Ontologien oder kontrollierte Vokabulare zur Standardisierung von Fachbegriffen, z. B. MeSH, AGROVOC.

Ergänzen Sie bei Bedarf im DMP:

**Interoperabilität:**  
- Daten werden in offenen Formaten gespeichert (siehe Abschnitt 2, Arten und Umfang der Daten)
- Metadaten-Standards: DataCite für Beschreibung und DOI-Referenzierung  
- Ontologien oder kontrollierte Vokabulare zur Standardisierung von Begriffen: Verwendung von [z. B. MeSH, AGROVOC] 

3.4 Reusable: Dokumentation und Lizenzierung beschreiben

Ohne Angabe einer Lizenz können Ihre Daten nicht weiterverwendet werden. Weit verbreitet und üblich sind die Lizenz CC-BY 4.0 für Dokumente und die MIT-Lizenz für ausführbaren Programmcode und Softwareprojekte.

Als recht freizügige Lizenz bietet die MIT-Lizenz ein geringes Risiko im Zusammenspiel mit anderen Lizenzen. Beispielsweise erlaubt sie die Wiederverwendung von Code in proprietärer Software. Creative-Commons-(CC)-Lizenzen sind dagegen nicht für die Nutzung in Software oder Hardware empfohlen (Bals (2024)).

Da Veröffentlichungen von Forschungsdaten häufig auch ausführbaren Code wie z.B. Python-Skripte beinhalten, bevorzugen wir im Zweifelsfall die MIT-Lizenz.

Ergänzen Sie bei Bedarf im DMP:

**Wiederverwendbarkeit:**  
- Lizenz: [z. B. MIT, erlaubt die Nachnutzung auch in proprietärer Software unter der Bedingung der Namensnennung]  
- Vollständige Dokumentation der Daten: [Methoden, Kontext, verwendete Software wie z. B. Python-Skripte mit spezifischen Bibliotheksversionen]
- Anleitungen für die Nachnutzung: [z. B. siehe README-Datei]

3.5 README-Datei und Zugriff auf Metadaten

Falls Metadaten generiert werden, können Sie darauf auch in der README-Datei verweisen. Verwenden Sie Zenodo, genügt ein Verweis auf den DOI, der auf Zenodo verweist.

  • Menschliche Nutzer können standardisierte Metadaten aus Zenodo exportieren (Abbildung 3.1).

  • Der softwaretechnische Zugriff auf Metadaten kann mittels Python-Skripte über die Zenodo-API realisiert werden.

Ergänzen Sie bei Bedarf in der README-Datei:

## Metadata
The dataset is described using the DataCite metadata schema. Key elements include:  
- **Title**: Title of the dataset.  
- **Author(s)**: Name(s) of the contributors.  
- **Keywords**: Relevant keywords for discoverability.  
- **Description**: Detailed dataset description, including methodology and tools.  
- **License**: MIT  
- **DOI**: [Zenodo DOI link].